رفع اعوجاج هندسی متون به‌کمک اطلاعات هندسی خطوط متن

نویسندگان

چکیده مقاله:

Document images produced by scanners or digital cameras usually have photometric and geometric distortions. If either of these effects distorts document, recognition of words from such a document image using OCR is subject to errors. In this paper we propose a novel approach to significantly remove geometric distortion from document images. In this method first we extract document lines from document using morphological operators. Then, extracted document lines are divided into a number of equal size column strips.  This allows to assume that each segment of line document is not curved. Each extracted document line segment is aligned horizontally. For this purpose, a segment line of document is rotated at different angels and for each rotation horizontal projection is obtained. The rotation angle with maximum peak at the corresponding projection signal is selected to align the line segment, horizontally. In order to estimate the geometrical distortion, for each document line a reference point is extracted from each line segment. These points indicate the position of a document line at starting column of line segments. Using reference points of a document line a polynomial function is fitted to each document line. At the end, geometric distortion for each part of the document is eliminated using a perspective transformation. This transformation is estimated based on the extracted polynomial function. To increase the stability of the proposed method for short text lines, the curve of adjacent text lines of longer length is used. A post processing stage is required after applying perspective transformation on document patches. Since this transformation is a continuous mapping but it is applied on digital images. To remove this distortion from the result, the consistency of each pixel value with the value of neighboring pixels are considered to correct the value of inconsistence pixels. The proposed method is implemented on Persian and English databases and has been compared with the existing methods. The results indicate the efficiency and accuracy of the proposed method in elimination of geometric distortions.  

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

رفع اعوجاج های فتومتریک و هندسی در تصاویر به کمک اطلاعات روشنایی پس زمینه و اطلاعات هندسی خطوط متن

تصاویر سند تهیه شده توسط اسکنر یا دوربین دیجیتال، همواره با دو نوع اعوجاج فتومتریک و اعوجاج هندسی همراه هستند. هر دو نوع اعوجاج، باعث کاهش دقت عملکرد نرم افزارهای ocr می شوند. در این پایان نامه سعی بر این است که با ارائه ی روشی نوین و همچنین بهبود روش های گذشته، به رفع اعوجاج اسناد به منظور بهبود عملکرد نرم افزارهای ocr دست یابیم. در این پایان نامه به منظور تصحیح اعوجاج فتومتریک از روش درون نگ...

15 صفحه اول

رفع اعوجاج هندسی، پرسپکتیو و کجی تصاویر متن دوربینی فارسی

تصاویر متن دوربینی غالباً با اعوجاج هندسی، پرسپکتیو و کجی همراه هستند. این اعوجاج ها، عملکرد سیستم های نویسه خوانی نوری را با مشکل روبرو می سازند. برای رفع این اعوجاج ها روش های مختلفی ارائه شده است. اما اغلب این روش ها بر متون لاتین تمرکز دارند و قابل استفاده مستقیم برای متون فارسی نمی باشند. در این پایان نامه روشی نوین جهت رفع اعوجاج هندسی، پرسپکتیو وکجی تصاویر متن دوربینی فارسی ارائه شده است....

15 صفحه اول

استفاده از نمایش هندسی دادهها در تحلیل اطلاعات

نگرش آمارشناسان به تحلیل داده ها، طی سی سال گذشته، دستخوش یک انقلاب شده است. این انقلاب را به درستی مرهون نشر اثر تاریخی جان توکی تحت عنوان تحلیل اکتشافی داده هامیدانند. هسته اولیه این انقلاب در مجموعه مقالات نوشته شده به وسیله توکی ، همفکران و دانشجویان او شکل گرفت. این انقلاب با مقاله سال ۱۹۶۲ توکی تحت عنوان « آینده تحلیل دادها» به جهت گیری روشنی دست یافت. محتوای این مقاله، به نیاز مشخص بسیار...

متن کامل

استفاده از نمایش هندسی داده ها در تحلیل اطلاعات

نگرش آمار شناسان به تحلیل داده ها، طی سی سال گذشته، دستخوش یک انقلاب شده است. این انقلاب را به درستی مرهون نشر اثر تاریخی جان توکی تحت عنوان تحلیل اکتشافی داده ها می دانند. هسته اولیه این انقلاب در مجموعه مقالات نوشته شده به وسیله توکی، همفکران و دانشجویان او شکل گرفت. این انقلاب با مقاله سال 1962 توکی تحت عنوان آینده تحلیل داده ها به جهت گیری روشنی دست یافت. محتوای این مقاله، به نیاز مشخص بسیا...

متن کامل

ارائه روش توسعه مدل زوال هندسی خطوط ریلی: رگرسیون یا زنجیره مارکوف

امروزه مزایای استفاده از سیستم حمل و نقل ریلی مانند ایمنی، ظرفیت جابجایی بالا و کاهش آلودگی‌های زیست‌محیطی موجب گسترش روزافزون آن گردیده است. به منظور ایجاد اطمینان از عملکرد مناسب این سیستم، برنامه‌ریزی عملیات نگهداری و تعمیرات خطوط ریلی امری اجتناب‌ناپذیر است. یکی از ملزومات اصلی این نوع برنامه‌ریزی توسعه مدل زوال خطوط ریلی است که به کمک آن می‌توان فهمید چه زمانی وضعیت خطوط ریلی از حداقل قابل...

متن کامل

ارزیابی هندسی فضایی مساجد معاصر تهران با استفاده از تحلیل مضمونی متون دینی

One of the most important problems in mosques designing is the quality of geometries and spaces which are appropriate for using in these religious buildings. It is obvious that one of the best references for studying this issue is Islamic teachings which are derived from verses and hadith. So, for responding to this question that what are the geometries and spaces which are appropriate for usin...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 14  شماره 2

صفحات  141- 158

تاریخ انتشار 2017-09

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

کلمات کلیدی

کلمات کلیدی برای این مقاله ارائه نشده است

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023